Descripción de la base

Column

Descripción

  • Información Estadística de número de empresas del sector privado distribuidos por distritos mensualmente en el año 2021.

  • Fuente: Superintendencia Nacional de Aduanas y de Administración Tributaria (SUNAT)

  • El marco principal de datos de dicha información tiene 1369 filas y 14 variables:

  • Ubigeo: factor con 1369 niveles

  • DISTRITOS: factor con 1369 niveles

  • ENERO: Número de empresas del sector privado en Enero 2021

  • FEBRERO: Número de empresas del sector privado en Febrero 2021

  • MARZO: Número de empresas del sector privado en Marzo 2021

  • ABRIL: Número de empresas del sector privado en Abril 2021

  • MAYO: Número de empresas del sector privado en Mayo 2021

  • JUNIO: Número de empresas del sector privado en Junio 2021

  • JULIO: Número de empresas del sector privado en Julio 2021

  • AGOSTO: Número de empresas del sector privado en Agosto 2021

  • SETIEMBRE: Número de empresas del sector privado en Setiembre 2021

  • OCTUBRE: Número de empresas del sector privado en Octubre 2021

  • NOVIEMBRE: Número de empresas del sector privado en Noviembre 2021

  • DICIEMBRE: Número de empresas del sector privado en Diciembre 2021

Column

Resumen

# A tibble: 16,428 x 4
   UBIGEO DISTRITOS   MES       NUMEROEMPRESAS
   <chr>  <chr>       <chr>              <dbl>
 1 010101 CHACHAPOYAS Enero                504
 2 010101 CHACHAPOYAS Febrero              490
 3 010101 CHACHAPOYAS Marzo                510
 4 010101 CHACHAPOYAS Abril                513
 5 010101 CHACHAPOYAS Mayo                 516
 6 010101 CHACHAPOYAS Junio                531
 7 010101 CHACHAPOYAS Julio                541
 8 010101 CHACHAPOYAS Agosto               553
 9 010101 CHACHAPOYAS Setiembre            550
10 010101 CHACHAPOYAS Octubre              560
# ... with 16,418 more rows
sf [1,874 x 78] (S3: sf/tbl_df/tbl/data.frame)
 $ UBIGEO    : chr [1:1874] "100902" "100904" "250305" "250302" ...
 $ OBJECTID  : num [1:1874] 1 2 3 4 5 6 7 8 9 10 ...
 $ NOMBDEP   : chr [1:1874] "HUANUCO" "HUANUCO" "UCAYALI" "UCAYALI" ...
 $ NOMBPROV  : chr [1:1874] "PUERTO INCA" "PUERTO INCA" "PADRE ABAD" "PADRE ABAD" ...
 $ NOMBDIST  : chr [1:1874] "CODO DEL POZUZO" "TOURNAVISTA" "ALEXANDER VON HUMBOLDT" "IRAZOLA" ...
 $ CAPITAL   : chr [1:1874] "CODO DEL POZUZO" "TOURNAVISTA" "ALEXANDER VON HUMBOLDT" "SAN ALEJANDRO" ...
 $ POBTOTAL  : num [1:1874] 7768 6219 6085 10941 9003 ...
 $ POB_EDAD_T: num [1:1874] 5022 4162 4172 7308 5983 ...
 $ POB_EDAD_E: num [1:1874] 4329 3577 3616 6368 5058 ...
 $ DENSIDAD  : num [1:1874] 2.34 2.79 31.89 10.95 15.54 ...
 $ POBMASCU  : num [1:1874] 4312 3490 3210 5670 4756 ...
 $ POBFEMEN  : num [1:1874] 3456 2729 2875 5271 4247 ...
 $ POBMASCU_P: num [1:1874] 55.5 56.1 52.8 51.8 52.8 ...
 $ POBFEMEN_P: num [1:1874] 44.5 43.9 47.2 48.2 47.2 ...
 $ R_MASCULIN: num [1:1874] 125 128 112 108 112 ...
 $ POBURBANA : num [1:1874] 2398 1495 4564 6922 4518 ...
 $ POBRURAL  : num [1:1874] 5370 4724 1521 4019 4485 ...
 $ POBURBANA_: num [1:1874] 30.9 24 75 63.3 50.2 ...
 $ POBRURAL_P: num [1:1874] 69.1 76 25 36.7 49.8 ...
 $ EDAD_PROME: num [1:1874] 25.5 26.9 27.3 25.8 26.3 ...
 $ POB_0_14  : num [1:1874] 2872 2162 2055 3866 3222 ...
 $ POB_15_29 : num [1:1874] 1888 1496 1508 2830 2236 ...
 $ POB_30_59 : num [1:1874] 2575 2125 2134 3713 2951 ...
 $ POB_60_MAS: num [1:1874] 432 435 388 532 594 ...
 $ VIV_PARTIC: num [1:1874] 2498 1683 1849 3820 2349 ...
 $ VIV_PART_1: num [1:1874] 1961 1397 1251 2491 1882 ...
 $ HOGARES   : num [1:1874] 1979 1407 1295 2563 1925 ...
 $ Shape_Leng: num [1:1874] 2.417 2.578 0.702 2.456 1.441 ...
 $ Shape_Area: num [1:1874] 0.2655 0.1432 0.0169 0.1543 0.0513 ...
 $ DIRECCION : chr [1:1874] "CODO DEL POZUZO,PUERTO INCA,HUANUCO" "TOURNAVISTA,PUERTO INCA,HUANUCO" "ALEXANDER VON HUMBOLDT,PADRE ABAD,UCAYALI" "IRAZOLA,PADRE ABAD,UCAYALI" ...
 $ POB_PROYEC: num [1:1874] 8248 6543 6159 12065 10501 ...
 $ POB_EDAD_1: num [1:1874] 64.6 66.9 68.6 66.8 66.5 ...
 $ POB_EDAD_2: num [1:1874] 55.7 57.5 59.4 58.2 56.2 ...
 $ EDAD_MEDIA: num [1:1874] 23 24 24 23 23 24 23 23 22 24 ...
 $ POB_0_14_P: num [1:1874] 37 34.8 33.8 35.3 35.8 ...
 $ POB_15_29_: num [1:1874] 24.3 24.1 24.8 25.9 24.8 ...
 $ POB_30_59_: num [1:1874] 33.1 34.2 35.1 33.9 32.8 ...
 $ POB_60_M_1: num [1:1874] 5.56 6.99 6.38 4.86 6.6 ...
 $ POB_ANALFA: num [1:1874] 518 318 394 760 317 ...
 $ POB_ANAL_1: num [1:1874] 10.57 7.84 9.78 10.74 5.48 ...
 $ HOMBRES_AN: num [1:1874] 173.4 94.5 122.4 248.4 101.5 ...
 $ HOMBRES__1: num [1:1874] 6.16 3.94 5.72 6.68 3.26 ...
 $ MUJERES_AN: num [1:1874] 344 224 272 511 216 ...
 $ MUJERES__1: num [1:1874] 16.55 13.5 14.37 15.25 8.07 ...
 $ MUJERES_ED: num [1:1874] 1700 1310 1491 2749 2118 ...
 $ MUJERES__2: num [1:1874] 49.2 48 51.9 52.1 49.9 ...
 $ TOTAL_MADR: num [1:1874] 1785 1372 1539 2553 2175 ...
 $ MADRES_SOL: num [1:1874] 103 101 168 238 148 894 177 177 90 482 ...
 $ MADRES_S_1: num [1:1874] 5.77 7.36 10.92 9.32 6.8 ...
 $ MUJERES_AD: num [1:1874] 478 449 406 821 685 ...
 $ MADRES_ADO: num [1:1874] 101 77 67 107 107 348 104 110 72 167 ...
 $ MADRES_A_1: num [1:1874] 21.1 17.1 16.5 13 15.6 ...
 $ AL_MENOS_1: num [1:1874] 476 451 573 836 717 ...
 $ AL_MENOS_2: num [1:1874] 6.13 7.25 9.42 7.64 7.96 ...
 $ SIN_DISCAP: num [1:1874] 7292 5768 5512 10105 8286 ...
 $ SIN_DISC_1: num [1:1874] 93.9 92.7 90.6 92.4 92 ...
 $ ALGUNA_NBI: num [1:1874] 62.6 54.5 55.1 59.2 60.5 ...
 $ NBI_PORC  : num [1:1874] 37.4 45.5 44.9 40.8 39.5 ...
 $ VIV_PART_2: num [1:1874] 78.5 83 67.7 65.2 80.1 ...
 $ IC_INF    : num [1:1874] 15.23 18.07 8.12 8.12 7.58 ...
 $ IC_SUP    : num [1:1874] 39.2 35.3 17.7 17.7 16.3 ...
 $ UBIC_POBMO: num [1:1874] 1181 1192 1657 1656 1680 ...
 $ TOTAL_DEFU: num [1:1874] 5 3 0 10 3 16 6 15 6 16 ...
 $ TOTAL_DE_1: num [1:1874] 5 5 3 15 16 34 10 15 7 35 ...
 $ TOTAL_DE_2: num [1:1874] 10 8 3 25 19 50 16 30 13 51 ...
 $ NAC_BAJOPE: num [1:1874] 4.33 4.58 3.7 3.08 0 ...
 $ NAC_BAJO_1: num [1:1874] 9 6 3 10 0 27 18 13 9 18 ...
 $ MUJERES_NA: num [1:1874] 46.2 48.1 49.4 48 0 ...
 $ MUJERES__3: num [1:1874] 96 63 40 156 0 360 104 127 65 159 ...
 $ HOMBRES_NA: num [1:1874] 53.8 51.9 50.6 52 0 ...
 $ HOMBRES__2: num [1:1874] 112 68 41 169 0 361 106 163 71 181 ...
 $ TOTAL_NACI: num [1:1874] 208 131 81 325 0 721 210 290 136 340 ...
 $ IND_121951: num [1:1874] 37 35 53 176 60 277 120 81 43 86 ...
 $ IND_122042: num [1:1874] 11868 7747 3893 11691 7432 ...
 $ IND_122047: num [1:1874] 9470 6279 3317 11225 6835 ...
 $ IND_516462: num [1:1874] 75000 13500 43950 125760 237441 ...
 $ IND_516484: num [1:1874] 730 1236 540 1366 691 ...
 $ geometry  :sfc_MULTIPOLYGON of length 1874; first list element: List of 1
  ..$ :List of 1
  .. ..$ : num [1:1294, 1:2] -75.3 -75.3 -75.3 -75.3 -75.3 ...
  ..- attr(*, "class")= chr [1:3] "XY" "MULTIPOLYGON" "sfg"
 - attr(*, "sf_column")= chr "geometry"
 - attr(*, "agr")= Factor w/ 3 levels "constant","aggregate",..: NA NA NA NA NA NA NA NA NA NA ...
  ..- attr(*, "names")= chr [1:77] "UBIGEO" "OBJECTID" "NOMBDEP" "NOMBPROV" ...
UBIGEO DISTRITOS MES NUMEROEMPRESAS PERIODO DEPARTAMENTO PROVINCIA DISTRITO
Length:16416 Length:16416 Length:16416 Min. : 0.0 Min. :202101 Length:16416 Length:16416 Length:16416
Class :character Class :character Class :character 1st Qu.: 1.0 1st Qu.:202104 Class :character Class :character Class :character
Mode :character Mode :character Mode :character Median : 5.0 Median :202107 Mode :character Mode :character Mode :character
NA NA NA Mean : 229.5 Mean :202107 NA NA NA
NA NA NA 3rd Qu.: 38.0 3rd Qu.:202109 NA NA NA
NA NA NA Max. :15744.0 Max. :202112 NA NA NA

Estructura

tibble [16,416 x 8] (S3: tbl_df/tbl/data.frame)
 $ UBIGEO        : chr [1:16416] "010101" "010101" "010101" "010101" ...
 $ DISTRITOS     : chr [1:16416] "CHACHAPOYAS" "CHACHAPOYAS" "CHACHAPOYAS" "CHACHAPOYAS" ...
 $ MES           : chr [1:16416] "Enero" "Febrero" "Marzo" "Abril" ...
 $ NUMEROEMPRESAS: num [1:16416] 504 490 510 513 516 531 541 553 550 560 ...
 $ PERIODO       : num [1:16416] 202101 202102 202103 202104 202105 ...
 $ DEPARTAMENTO  : chr [1:16416] "AMAZONAS" "AMAZONAS" "AMAZONAS" "AMAZONAS" ...
 $ PROVINCIA     : chr [1:16416] "CHACHAPOYAS" "CHACHAPOYAS" "CHACHAPOYAS" "CHACHAPOYAS" ...
 $ DISTRITO      : chr [1:16416] "CHACHAPOYAS" "CHACHAPOYAS" "CHACHAPOYAS" "CHACHAPOYAS" ...
NULL

Evolutivo de Empresas Privadas en Regiones del Perú - 2021

Row

Evolutivo Número de Empresas Región Lima vs Región Norte

Evolutivo Número de Empresas Región Lima vs Región Centro

Row

Evolutivo Número de Empresas Región Lima vs Región Sur

Evolutivo Número de Empresas Región Lima vs Región Oriente

Distribución de Empresas Privadas en Distritos de Lima Metropolitana y Callao - 2021

Row

Distribución de Número de Empresas por Distritos de Lima Metropolitana y Callao

Distribución de Empresas Privadas en Zonas de Lima Metropolitana y Callao - 2021

Row

Diagrama de Cajas por Zonas de Lima Metropolitana y Callao

Histograma de Número de Empresas por Zonas de Lima Metropolitana y Callao

Row

Distribución de Empresas Privadas por Zonas de Lima Metropolitana y Callao

Densidad de Empresas Privadas por Zonas de Lima Metropolitana y Callao

---
title: Dashboard Empresas Sector Privado Desarrollado por Angel Salomon Rodriguez Naola


output: 
  flexdashboard::flex_dashboard:
    theme: sandstone
    social: menu
    source_code: embed
    orientation: columns
    vertical_layout: fill
---


```{r setup, include=FALSE}
library(tidyverse)
library(grid)
library(gridExtra)
library(sf)
library(readxl)
library(ggrepel)
library(readr)
library(ggplot2)
library(ggalt)
library(dslabs)
library(CGPfunctions)
library(flexdashboard)
library(yaml)
library(knitr)
require(plotly)
library(ggplot2)
require(gganimate)
require(esquisse)
require(gapminder)
library(ggplot2)
library(kableExtra)
library(animation)

```
**Descripción de la base** 
=======================================================================

Column {data-width=500}
-----------------------------------------------------------------------




### **Descripción**

- Información Estadística de número de empresas del sector privado distribuidos por distritos mensualmente en el año 2021.
- Fuente: Superintendencia Nacional de Aduanas y de Administración Tributaria (SUNAT) 
- El marco principal de datos de dicha información tiene 1369 filas y 14 variables:

- **Ubigeo**: factor con 1369 niveles
- **DISTRITOS**: factor con 1369 niveles
- **ENERO**: Número de empresas del sector privado en Enero 2021
- **FEBRERO**: Número de empresas del sector privado en Febrero 2021
- **MARZO**: Número de empresas del sector privado en Marzo 2021
- **ABRIL**: Número de empresas del sector privado en Abril 2021
- **MAYO**: Número de empresas del sector privado en Mayo 2021
- **JUNIO**: Número de empresas del sector privado en Junio 2021
- **JULIO**: Número de empresas del sector privado en Julio 2021
- **AGOSTO**: Número de empresas del sector privado en Agosto 2021
- **SETIEMBRE**: Número de empresas del sector privado en Setiembre 2021
- **OCTUBRE**: Número de empresas del sector privado en Octubre 2021
- **NOVIEMBRE**: Número de empresas del sector privado en Noviembre 2021
- **DICIEMBRE**: Número de empresas del sector privado en Diciembre 2021




Column {data-width=500}
-----------------------------------------------------------------------


### **Resumen**

```{r}

setwd("~/ANGEL RODRIGUEZ/CURSO ANALITICA DE DATOS Y GEOREFERENCIACION CON R UNI/EXAMEN FINAL")
options(scipen = 999)

#Cargando la base de Datos
df <- read_csv("Empresas sector privado por mes Segun Distritos 2021.csv")

# Renombrando Columnas

df<-rename(df, UBIGEO = `Código de Ubigeo`)

#Eliminando Espacios en los campos numericos

dfn <-as.data.frame(apply(df,2,function(x) str_replace_all(string=x,pattern=" ", repl="")))


# Pivoteando el dataframe df

dft <- dfn %>%
    pivot_longer(cols = Enero:Diciembre,
        names_to = "MES",
        values_to = "NUMEROEMPRESAS" )


#Cambiando de formato caracter a numerico
dft$NUMEROEMPRESAS<-as.numeric(dft$NUMEROEMPRESAS)

#Asignando valores NA a cero
dft[is.na(dft)] <- 0
dft


# Recodificando los meses en Periodo del año 2021

dft$PERIODO[dft$MES =="Enero"] <-202101
dft$PERIODO[dft$MES =="Febrero"] <-202102
dft$PERIODO[dft$MES =="Marzo"] <-202103
dft$PERIODO[dft$MES =="Abril"] <-202104
dft$PERIODO[dft$MES =="Mayo"] <-202105
dft$PERIODO[dft$MES =="Junio"] <-202106
dft$PERIODO[dft$MES =="Julio"] <-202107
dft$PERIODO[dft$MES =="Agosto"] <-202108
dft$PERIODO[dft$MES =="Setiembre"] <-202109
dft$PERIODO[dft$MES =="Octubre"] <-202110
dft$PERIODO[dft$MES =="Noviembre"] <-202111
dft$PERIODO[dft$MES =="Diciembre"] <-202112


# Carguemos el mapa 
distrital <- read_sf("mapasDsto/DISTRITOS_inei_geogpsperu_suyopomalia.shp")
str(distrital)

# Uniendo el Departamento y Provincia

dft$DEPARTAMENTO <- distrital$NOMBDEP[ match(dft$UBIGEO, distrital$UBIGEO) ]
dft$PROVINCIA <- distrital$NOMBPROV[ match(dft$UBIGEO, distrital$UBIGEO) ]
dft$DISTRITO <- distrital$NOMBDIST[ match(dft$UBIGEO, distrital$UBIGEO) ]

#Eliminando los NA's
dft <- dft[!is.na(dft$DEPARTAMENTO),]


#Resumen de los datos
resumen <- summary(dft)
kable(resumen) %>% 
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"))
  
```


### **Estructura**

```{r}
st <- str(dft)
st
  
```




**Evolutivo de Empresas Privadas en Regiones del Perú - 2021 **
============================================================================

Row
----------------------------------------------------------------------------

### **Evolutivo Número de Empresas Región Lima vs Región Norte**
```{r}

#Agrupando por Departamento
dep<-dft %>%
  group_by(DEPARTAMENTO,PERIODO) %>%
  summarise(NUMEROEMPRESAS=sum(NUMEROEMPRESAS))


dep$PERIODO=as.character(dep$PERIODO)

#distLimaCallao<-as.data.frame(distLimaCallao)

depLimaNorte <- c("ANCASH","CAJAMARCA","CALLAO","LA LIBERTAD","LAMBAYEQUE","LIMA","PIURA","TUMBES")

labels <- data.frame(DEPARTAMENTO = depLimaNorte, x = c(2,3,4,5,6,7,8,11), y = c(8500, 6500,11200,12900,18900,172000,11000,30))
p<-dep %>% filter(DEPARTAMENTO %in% depLimaNorte) %>%
  ggplot(aes(PERIODO, NUMEROEMPRESAS, col = DEPARTAMENTO,group=DEPARTAMENTO)) +
  geom_line() +
  geom_text(data = labels, aes(x, y, label = DEPARTAMENTO), size = 4) +
  theme(legend.position = "none")


ggplotly(p)

```

### **Evolutivo Número de Empresas Región Lima vs Región Centro**
```{r}

#Evolutivo Numero de Empresas Región Lima vs Región Centro

depLimaCentro <- c("CALLAO","JUNIN", "HUANCAVELICA","HUANUCO","LIMA","PASCO")

labels <- data.frame(DEPARTAMENTO = depLimaCentro, x = c(2,4,6,8,10,12), y = c(12050, 10000, 30,8000,171900,1870))
q<-dep %>% filter(DEPARTAMENTO %in% depLimaCentro) %>%
  ggplot(aes(PERIODO, NUMEROEMPRESAS, col = DEPARTAMENTO,group=DEPARTAMENTO)) +
  geom_line() +
  geom_text(data = labels, aes(x, y, label = DEPARTAMENTO), size = 4) +
  theme(legend.position = "none")

ggplotly(q)

```


Row
-----------------------------------------------------------------------


### **Evolutivo Número de Empresas Región Lima vs Región Sur**

```{r}
#Evolutivo Numero de Empresas Región Lima vs Región Sur

depLimaSur <- c("APURIMAC","AREQUIPA","AYACUCHO","CALLAO","CUSCO", "ICA","LIMA","MOQUEGUA","PUNO","TACNA")

labels <- data.frame(DEPARTAMENTO = depLimaSur, x = c(2,3,4,5,6,7,8,9,11,12), y = c(250, 24000,300,12000,9800,9550,175000,250,2200,1800))
r<-dep %>% filter(DEPARTAMENTO %in% depLimaSur) %>%
  ggplot(aes(PERIODO, NUMEROEMPRESAS, col = DEPARTAMENTO,group=DEPARTAMENTO)) +
  geom_line() +
  geom_text(data = labels, aes(x, y, label = DEPARTAMENTO), size = 4) +
  theme(legend.position = "none")

ggplotly(r)
```

### **Evolutivo Número de Empresas Región Lima vs Región Oriente**

```{r}
#Evolutivo Numero de Empresas Región Lima vs Región Oriente

depLimaOriente <- c("AMAZONAS","CALLAO","LIMA", "LORETO","MADRE DE DIOS","SAN MARTIN","UCAYALI")

labels <- data.frame(DEPARTAMENTO = depLimaOriente, x = c(2,4,6,8,10,11,12), y = c(250, 12300, 172000,6000,4000,8150,2500))
s<-dep %>% filter(DEPARTAMENTO %in% depLimaOriente) %>%
  ggplot(aes(PERIODO, NUMEROEMPRESAS, col = DEPARTAMENTO,group=DEPARTAMENTO)) +
  geom_line() +
  geom_text(data = labels, aes(x, y, label = DEPARTAMENTO), size = 4) +
  theme(legend.position = "none")
ggplotly(s)
```



**Distribución de Empresas Privadas en Distritos de Lima Metropolitana y Callao - 2021 **
============================================================================

Row
----------------------------------------------------------------------------

### **Distribución de Número de Empresas por Distritos de Lima Metropolitana y Callao**
 
```{r}

LimaMetrop <-  dft %>%
  filter((DEPARTAMENTO == "LIMA" | DEPARTAMENTO=="CALLAO") & (PROVINCIA =="LIMA" | PROVINCIA=="CALLAO") )


LimaMetrop$PERIODO=as.character(LimaMetrop$PERIODO)

# Grafico de Numero de Empresas por Periodo, por Cada Dsitrito de Lima Metropolitana
t<-ggplot(LimaMetrop, aes(x=PERIODO, y = NUMEROEMPRESAS,group=1)) +
  geom_line(color="grey") +
  geom_point(color="blue") +
 facet_wrap(~DISTRITO) + 
  theme_minimal(base_size = 10) +
  theme(axis.text.x = element_text(angle = 90,hjust=1)) +
  labs(title = "Número de Empresas por Distritos de Lima Metropolitana",
       x = "Periodo",
       y = "Numero de Empresas")

ggplotly(t)

```


**Distribución de Empresas Privadas en Zonas de Lima Metropolitana y Callao - 2021 **
============================================================================

Row
----------------------------------------------------------------------------

### **Diagrama de Cajas por Zonas de Lima Metropolitana y Callao**
```{r}

# Cargando Los Distritos de Lima y Callao
LimaMetPer <- dft %>%
  filter((DEPARTAMENTO == "LIMA" | DEPARTAMENTO=="CALLAO") & (PROVINCIA =="LIMA" | PROVINCIA=="CALLAO") )


# Recodificación de Distritos de Lima y Callao por Zonas

LimaMetPer$ZONA[LimaMetPer$DISTRITO =="BREÑA"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="JESUS MARIA"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="LA VICTORIA"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="RIMAC"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="LINCE"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="MAGDALENA DEL MAR"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="MIRAFLORES"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="PUEBLO LIBRE"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SAN BORJA"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SAN ISIDRO"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="BARRANCO"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SAN MIGUEL"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SANTIAGO DE SURCO"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SURQUILLO"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="LIMA"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="ANCON"] <-"LIMA NORTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="CARABAYLLO"] <-"LIMA NORTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="COMAS"] <-"LIMA NORTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="INDEPENDENCIA"] <-"LIMA NORTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="LOS OLIVOS"] <-"LIMA NORTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="PUENTE PIEDRA"] <-"LIMA NORTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SAN MARTIN DE PORRES"] <-"LIMA NORTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SANTA ROSA"] <-"LIMA NORTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="ATE"] <-"LIMA ESTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="CHACLACAYO"] <-"LIMA ESTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="CIENEGUILLA"] <-"LIMA ESTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="EL AGUSTINO"] <-"LIMA ESTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="LA MOLINA"] <-"LIMA ESTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="LURIGANCHO"] <-"LIMA ESTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SAN JUAN DE LURIGANCHO"] <-"LIMA ESTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SAN LUIS"] <-"LIMA ESTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SANTA ANITA"] <-"LIMA ESTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="CHORRILLOS"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="LURIN"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="PACHACAMAC"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="PUCUSANA"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="PUNTA HERMOSA"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="PUNTA NEGRA"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SAN BARTOLO"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SAN JUAN DE MIRAFLORES"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SANTA MARIA DEL MAR"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="VILLA EL SALVADOR"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="VILLA MARIA DEL TRIUNFO"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="BELLAVISTA"] <-"CALLAO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="CALLAO"] <-"CALLAO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="CARMEN DE LA LEGUA REYNOSO"] <-"CALLAO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="LA PERLA"] <-"CALLAO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="LA PUNTA"] <-"CALLAO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="MI PERU"] <-"CALLAO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="VENTANILLA"] <-"CALLAO"

# Resumiendo por Zonas y Distritos 
distLimaPer<-LimaMetPer %>%
  group_by(ZONA,DISTRITO,PERIODO) %>%
  summarise(NUMEROEMPRESAS=sum(NUMEROEMPRESAS))

# Grafico de Boxplot por Zonas de Lima Metropolitana y Callao

p <- ggplot(distLimaPer, aes(x=ZONA, y=NUMEROEMPRESAS, fill=ZONA, color=ZONA)) + 
  geom_boxplot(alpha=0.3)+
  labs(y = "Número de Empresas", x = "") +
  ggtitle('Diagrama de Cajas por Zonas')

ggplotly(p)

```



### **Histograma de Número de Empresas por Zonas de Lima Metropolitana y Callao**
 
```{r}

k <- ggplot(distLimaPer, aes(x=NUMEROEMPRESAS))+
  geom_histogram(fill='lightseagreen', color="lightseagreen", alpha=0.5)+
  ggtitle('Histograma del Numero de Empresas')+
  labs(y = "Cantidad", x = "Número de Empresas")

ggplotly(k)

```


Row
-----------------------------------------------------------------------


### **Distribución de Empresas Privadas por Zonas de Lima Metropolitana y Callao**

```{r}
j <- ggplot(distLimaPer, aes(x=ZONA)) + geom_bar(fill=c('lightseagreen','lightskyblue','lightskyblue1',
                                                     'lightskyblue2', 'lightskyblue3')) +
  ggtitle('Distribución por Zonas') +
  labs(y = "Cantidad", x = "")

ggplotly(j)
 
```

### **Densidad de Empresas Privadas por Zonas de Lima Metropolitana y Callao**

```{r}
m <- ggplot(distLimaPer, aes(x=NUMEROEMPRESAS, colour=ZONA, fill=ZONA))+
  geom_density(alpha=0.4) +
  ggtitle('Densidad por Zonas') +
  labs(y = "Densidad", x = "Número de Empresas")
ggplotly(m)

```